課程資訊
課程名稱
資訊檢索與文字探勘導論
INTRODUCTION TO INFORMATION RETRIEVAL AND TEXT MINING 
開課學期
97-1 
授課對象
管理學院  資訊管理學研究所  
授課教師
陳建錦 
課號
IM5030 
課程識別碼
725EU3410 
班次
 
學分
全/半年
半年 
必/選修
選修 
上課時間
星期四6,7,8(13:20~16:20) 
上課地點
管二204 
備註
本課程以英語授課。
限學士班三年級以上 且 限本系所學生(含輔系、雙修生)
總人數上限:25人 
Ceiba 課程網頁
http://ceiba.ntu.edu.tw/971IRTM 
課程簡介影片
 
核心能力關聯
核心能力與課程規劃關聯圖
課程大綱
為確保您我的權利,請尊重智慧財產權及不得非法影印
課程概述

本課程將介紹資訊檢索與文字探勘等研究議題,歡迎大三以上及研究所學生選修。 

課程目標
本課程的第一部分將介紹傳統的資訊檢索技術,如文件的表示法
、關鍵字重要性、資訊檢索系統的評估方法。第二部分將涉及一些文字探勘的議題,如文件自動分類與分群、時件偵測與追蹤、文件摘要法等。藉此提供一套完整的資訊檢索與文字探勘介紹  
課程要求
probability, programming language, data structure 
預期每週課後學習時數
 
Office Hours
每週三 09:00~10:00 
指定閱讀
 
參考書目
Christopher D. Manning,
Prabhakar Raghavan, and
Hinrich
Schutze, "Introduction to
Information Retrieval,"
Cambridge University Press.
2008. 
評量方式
(僅供參考)
 
No.
項目
百分比
說明
1. 
期中考 
30% 
 
2. 
程式作業 
30% 
(約4次) 
3. 
Term Project 
40% 
 
 
課程進度
週次
日期
單元主題
第1週
9/18  Syllabus,
Chapter 2, The Term Vocabulary,
Programming Assignment 1. 
第2週
9/25  PAT Tree and Chinese Keyword Extraction 
第3週
10/02  Scoring, Term Weighting and the Vector Space Model, Programming Assignment 2 
第4週
10/09  Evaluation in Information Retrieval 
第5週
10/16  Relevance Feedback and Query Expansion 
第6週
10/23  Probabilistic Information Retrieval 
第7週
10/30  Language Models for Information Retrieval 
第8週
11/06  Text Classification and Naive Bayes 
第9週
11/13  Midterm 
第10週
11/20  Text Classification and Naive Bayes, Programming Assignment 3 
第11週
11/27  Vector Space Classification 
第12週
12/04  Flat Clustering 
第13週
12/11  Flat Clustering 
第14週
12/18  Flat Clustering
Topic Detection and Incremental Clustering 
第15週
12/25  Hierarchical Clustering 
第17週
1/08  Link Analysis 
第18週
2009/01/15  Project Presentation